فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها




گروه تخصصی











متن کامل


اطلاعات دوره: 
  • سال: 

    1386
  • دوره: 

    13
تعامل: 
  • بازدید: 

    421
  • دانلود: 

    242
چکیده: 

در یک سیستم بازشناسی گفتار به دلایل مختلف ممکن است لغات به اشکال گوناگون تلفظ شوند. در بازشناسی گفتار محاوره ای میزان تغییرات تلفظی افزایش می یابد و از آنجا که وجود تغییرات تلفظی ممکن است سبب رخداد خطا در سیستم بازشناسی گفتار شود، مدل کردن این تغییرات به عنوان راهی برای بهبود دقت سیستم بازشناسی گفتار مورد توجه قرار گرفته است. در این مقاله نتایج بازشناسی گفتار بعد و قبل از اعمال مدل کردن تغییرات تلفظی به شکل ضمنی و در سطوح مختلف در سیستم بازشناسی گفتار برای مجموعه دادگان فارس دات کوچک مورد بررسی قرار گرفته است. با مدل کردن ضمنی تغییرات تلفظی با در نظر گرفتن چند گوسی در هر حالت و به کار بردن واحد آوایی سه واجی در سطح مدل آکوستیکی و واژگان دقت بازشناسی %83.2 است. در حالی که بدون مدل کردن این تغییرات دقت سیستم حدود 71% است که این مطلب گویای اهمیت توجه به مدل کردن تغییرات تلفظی در سیستم های بازشناسی گفتار، به خصوص در مورد مجموعه دادگانی است که گفتارهای محاوره ای در آنها زیاد است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 421

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 242
نشریه: 

امیرکبیر

اطلاعات دوره: 
  • سال: 

    1381
  • دوره: 

    14
  • شماره: 

    53
  • صفحات: 

    80-92
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    1294
  • دانلود: 

    0
چکیده: 

در بازشناسی گفتار پیوسته مدل سازی وابسته به متن می تواند موجب افزایش دقت بازشناسی و در عین حال افزای تعداد مدلها شود. این افزایش در تعداد مدلها می تواند مواجهه با کمبود داده های آموزشی را موجب گردد. روشهای مختلفی همانند گره زدن پارامترهای مدلها یا استفاده از تخمین MAP برای غلبه بر این مشکل به کار می روند. در این مقاله روشی جدید برای آموزش ارائه شده است که محاسن هر دو روش MAP و گره زدن را تواما و به نتایج بهتری نیز منجر می شود. مدلهای مورد استفاده از نوع سه آوایی می باشند.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1294

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

صادقی وحید

اطلاعات دوره: 
  • سال: 

    1398
  • دوره: 

    16
  • شماره: 

    4 (پیاپی 42)
  • صفحات: 

    135-149
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    457
  • دانلود: 

    153
چکیده: 

یکی از فعالیت های شناختی پیچیده در چارچوب نظام آوایی زبان این است که اهل زبان قادرند گفتار پیوسته را به صورت زنجیره واژگان گسسته درک کنند. یافته های پیشین مطالعات آزمایشگاهی بر روی زبان فارسی و دیگر زبان ها نشان داده است، در زبان هایی که در آنها تکیه به طور ثابت (یا با فراوانی وقوع زیاد) در مرز آغازی یا پایانی واژه قرار می گیرد، شنونده ها از نشانه های آکوستیکی تکیه برای تقطیع گفتار پیوسته به واژگان سازنده آن استفاده می کنند. همچنین، این گونه فرض شده است که حضور تکیه در جایگاهی غیر از مرز آغازی یا پایانی واژه مانع از کارکرد مرزنمایی این عامل نوایی می شود. در زبان فارسی حضور واژه بست در واژه باعث می شود که تکیه در جایگاهی غیر از پایان واژه واقع شود. پژوهش حاضر با هدف پاسخ گویی به یک سوال اساسی درباره نحوه پردازش درکی گفتار پیوسته فارسی انجام شد: آیا مرز پایانی واژگان (اعم از واژگان حاوی واژه بست و واژگان فاقد واژه بست) با توجه به ساخت نواختی واژگان در دستور واجی آهنگ فارسی برای شنونده قابل شناسایی است؟ برای این منظور دوآزمایش شنیداری انجام شد. نتایج این آزمایش ها نشان داد که شنونده هر نقطه پایانی H (در یک گستره نواختی H) در منحنی آهنگ گفتار فارسی را به صورت مرز پایانی یک واژه شناسایی می کند. همچنین نتایج به دست آمده نشان داد که درک شنیداری الگوی برجستگی نوایی وابسته به محل وقوع قله H تکیه زیروبمی است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 457

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 153 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1380
  • دوره: 

    10
تعامل: 
  • بازدید: 

    521
  • دانلود: 

    135
چکیده: 

در اینجا یک مدل وقایع گسسته برای بازشناسی گفتار پیوسته فارسی مستقل از گوینده ارایه شده است. در این مدل شبکه عصبی جلو سوی با تاخیر زمانی TDNN با دو لایه پنهان برای بازشناسی وقایع صوتی سیگنال گفتار تعلیم داده شده است.وقایع (events)، اتفاقات گذرا و لحظه ای خاصی هستند که در سیگنال صحبت رخ می دهند و حاوی اطلاعات قابل توجهی می باشند. در تعریف آنها از تجربیات زیست شناختی و عصب شناختی شنوایی و همچنین اطلاعات زبانشناختی و بررسی نحوه تولید آواهای زبان فارسی استفاده شده است.علاوه بر آن با تحلیل خطاهای سیستم های بازشناسی بر پایه فریم و یا بر پایه بازشناسی مرز واجها و انجام آزمایشات ریاضی مختلف بر روی پارامترها سعی شده کلاسهای مختلف وقایع به گونه ای معرفی شوند که بیانگر نواحی گذرا و سریع سیگنال باشند و تناقضات موجود در نحوه برچسب دهی واحدها که مانع از یادگیری کامل شبکه ها می شدند را نیز برطرف کنند.در آزمایش از دادگان فارس دات و پارامترهای LHCB استفاده شده است و میزان صحت شناسایی وقایع توسط برنامه استاندارد NIST استخراج شده که نتایج در مقایسه با سایر روشها امیدوار کننده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 521

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 135
نشریه: 

استقلال

اطلاعات دوره: 
  • سال: 

    1383
  • دوره: 

    23
  • شماره: 

    2
  • صفحات: 

    39-50
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    799
  • دانلود: 

    136
چکیده: 

روشهای مختلفی برای تطبیق گوینده در سیستمهای بازشناسی گفتار معرفی گردیده اند. در برخی روشها نظیر تخمین MAP تنها مدلهایی که داده آموزشی متناظرشان موجود باشد تازه سازی می شوند و برای بهبود قابل توجه دقت بازشناسی، داده آموزشی نسبتا زیادی مورد نیاز است. در برخی دیگر نظیر MLLR که تعدادی تبدیلات عمومی بر روی خوشه های مدلها اعمال می شود، برای دادگاه کم آموزشی نتایج مطلوبی حاصل می شود، اما با افزایش دادگان، کارایی به حد اشباع می رسد. در این مقاله روش جدیدی مطرح می شود که از مزایای هر دو بخش فوق برای دسترسی به کیفیت بالاتر بهره می برد. در این روش مدلهایی که داده آموزشی آنها موجود است به کمک تخمین MAP آموزش می بینند و برای مدلهایی که داده آموزشی (کافی) ندارند، با استفاده از روش MLLR  مقادیر پیشینه مناسب برای تخمین MAP تامین می شود. این روش، در عمل، بر روی یک سیستم آموزش دیده بر اساس دادگان فارس دات به نتایج بهتری نسبت به هر یک از دو روش MAP و MLLR دست یافته است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 799

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 136 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 1
اطلاعات دوره: 
  • سال: 

    1383
  • دوره: 

    15
  • شماره: 

    1
  • صفحات: 

    195-208
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    967
  • دانلود: 

    0
چکیده: 

این مقاله به بررسی یک مدل آماری زبان بر اساس دستجات منطقی دستوری زبان فارسی برای استفاده از بازشناسی گفتار پیوسته می پردازد. این مدل زبان بر اساس دستجات منطقی N- گرام با طول متغیر کار می کند و در آن بجای پیدا کردن الگوهای آماری مربوط به دنباله های کلمات، روابط بین دسته های منطقی از کلمات، مورد بررسی قرار می گیرند. این تحقیق در سه مرحله خوشه بندی کلمات، بدست آوردن مدل آماری زبان با استفاده از ساختار درختی و اعمال مدل زبان به سیستم بازشناسی انجام شده است. مهم ترین مزیت این مدل امکان پذیرسازی بازگشت به مسیر صحیح در شرایط که مدل آماری معمولی چنین اجازه ای را نمی دهد، می باشد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 967

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1386
  • دوره: 

    13
تعامل: 
  • بازدید: 

    591
  • دانلود: 

    142
چکیده: 

در این مقاله روش جدیدی برای خوشه بندی کلمات به منظور ساخت مدل زبانی n-gram برای زبان فارسی ارایه شده است که در آن مشکل پیچیدگی روش های خودکار و سرگشتگی بالای روش های دستی به حداقل رسیده است. در این روش هر کلمه با یک بردار ویژگی نمایش داده می شود که این بردار معرف امار مقوله های نحوی مربوط به آن کلمه است. سپس بردارهای حاصل با استفاده از الگوریتم k-means خوشه بندی می شوند، پیاده سازی و آزمایش های مربوط بر روی پیکره متنی زبان فارسی که شامل حدود 10 میلیون کلمه می باشد، صورت گرفته است. نتایج بیانگر کاهش 34 درصدی در سرگشتگی و کاهش 16 درصدی در نرخ خطای بازشناسی نسبت به روش های دستی مبتنی بر مقوله های نحوی است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 591

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 142
اطلاعات دوره: 
  • سال: 

    1382
  • دوره: 

    9
تعامل: 
  • بازدید: 

    434
  • دانلود: 

    116
چکیده: 

مدل مخلفی مارکف یکی از روشهای پر استفاده در بازشناسی گفتار است و در اغلب موارد کارایی خوبی از خود نشان داده است. استفاده از شبکه عصبی نیز در سیستم های شناسایی الگو متداول می باشد و در بازشناسی گفتار نیز بکار گرفته شده است. از آنجایی که هر یک از این دو روش دارای نقاط ضعف و قوتی می باشند، به منظور بهره گیری از نقاط قوت مدل مخفی مارکف و شبکه های عصبی، یک مدل هیبرید متشکل از مد مخفی مارکف پیوسته و شبکه عصبی نگاشت خودسازمانده برای مدل کردن واجها پیاده سازی و برای بازشناسی گفتار پیوسته مورد استفاده قرار داده ایم و توانسته ایم با استفاده همزمان از بردارهای وزن شبکه عصبی و توابع چگالی احتمال مدل مخفی مارکف، راندمان سیستم هیبرید را نسبت به سیستمی که تنها با استفاده همزمان از بردارهای وزن شبکه عصبی و توابع چگالی احتمال مدل مخفی مارکف، راندمان سیستم هیبرید را نسبت به سیستمی که تنها از مدل مخفی مارکف استفاده شده است، بطور متوسط تا حدود 1.6 درصد بهبود بخشیم. در سیستم هیبریدی که برای بازشناسی گفتار پیوسته و مستقل از گوینده زبان فارسی پیاده سازی نمودیم در بهترین حالت و بدون استفاده از مدل های زبانی دقت 56.8 درصد را در سطح جمله بدست آورده ایم.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 434

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 116
اطلاعات دوره: 
  • سال: 

    1382
  • دوره: 

    -
  • شماره: 

    13
  • صفحات: 

    43-56
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1178
  • دانلود: 

    0
چکیده: 

مدلسازی وابسته به متن به عنوان شیوه ای مفید برای افزایش دقت مدلسازی در بازشناسی گفتار پیوسته مورد توجه است. معمولترین شکل پیاده سازی این شیوه، استفاده از مدلهای سه آوایی است. با این همه، تعداد زیاد این مدلها موجب می شود که در عمل، آموزش سیستم با مشکلات زیادی همراه باشد و دستیابی به آموزش مقاوم (Robust training) به سختی میسر گشته یا اصولا مقدور نشود. یکی از شیوه های حل این مشکل، استفاده از روش گره زدن (Tying) پارامترها است. در این مقاله خوشه بندی (Clustering) برای پارامترهای حالت مدل HMM صورت گرفته و حالتهای قرار گرفته در خوشه با یکدیگر گره زده شده اند تا در کل سیستم، تعداد پارامترها کاهش یافته و آموزش مقاوم حاصل شود. دو نوع دسته بندی یکی بر اساس پارامترهای مدلهای نهایی آموزش دیده و فاصله بین آنها و دیگری به کمک داده های آموزشی و بر مبنای درخت تصمیم گیری انجام شده است. در پیاده سازی روش اخیر به طراحی درخت تصمیم گیری بر اساس ویژگیهای آکوستیکی آواها در زبان فارسی و شباهتها و تفاوتهای آنها اقدام شده است. نتایج بدست آمده، موفقیت آمیز بودن هر دو روش را تایید کرده است. با این حال، مزیت روش دوم در امکانپذیر ساختن تخمین پارامترهای مدلهای دیده نشده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1178

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1395
  • دوره: 

    -
  • شماره: 

    1 (پیاپی 27)
  • صفحات: 

    39-59
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    955
  • دانلود: 

    196
چکیده: 

در این مقاله به معرفی شبکه های عصبی پیمانه ای عمیق و قابل رشد به منظور بهبود بازشناسی گفتار پیوسته پرداخته می شود. ساختار این شبکه ها و روش های پیش تعلیم معرفی شده برای آنها به گونه ای است که درعین هماهنگی با ساختار گفتار، در حافظه و محاسبات لازم صرفه جویی می شود. به دلیل قابلیت رشد این ساختارها، در تعلیم آنها اطلاعات فضایی-زمانی بردارهای بازنمایی در ورودی و اطلاعات فضایی-زمانی برچسب آوایی آنها را در خروجی شبکه عصبی می توان انجمن کرد. شبکه تعلیم یافته با این ساختار انجمن گر فضایی-زمانی دوگانه، می تواند زیرفضای زنجیره های معتبر آوایی دادگان را یاد بگیرد. بنابراین، در ساختار خود زنجیره های خروجی نامعتبر را پالایش کرده و زنجیره های درست را می دهد. جهت بررسی عملکرد این ساختارها، از دو دسته دادگان گفتاری فارس دات و فارس دات بزرگ استفاده شد. نتایج آزمایش ها نشان می دهند که می توان دقت بازشناسی آوا را برروی دادگان فارس دات تا %2.7 با استفاده از شبکه های عصبی پیمانه ای عمیق نسبت به مدل های مخفی مارکوف بالا برد، که با توسعه آنها به ساختار فضایی-زمانی دوگانه این نتیجه تا %5.1 بهبود می یابد. به دلیل عدم وجود برچسب های آوایی برای دادگان بزرگ، یک روش تعلیم نیمه سرپرستی شده برای تعلیم شبکه های عصبی برروی این دادگان پیشنهاد شده است که می تواند به درصد بازشناسی قابل مقایسه ای با مدل های مخفی مارکوف دست یابد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 955

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 196 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button